Liste der häufigsten Wörter der deutschen Sprache – Wikipedia

您所在的位置:网站首页 7542 2001 150 Liste der häufigsten Wörter der deutschen Sprache – Wikipedia

Liste der häufigsten Wörter der deutschen Sprache – Wikipedia

2024-06-17 17:42| 来源: 网络整理| 查看: 265

Die Liste der häufigsten Wörter der deutschen Sprache beruht auf statistischen Auswertungen von Publikationen in deutscher Sprache.

Eine im Kaedings Häufigkeitswörterbuch 1897 publizierte Auszählung von rund elf Millionen Wörtern ergab, dass nur 207 Wortformen nach ihrer Häufigkeit (Okkurrenz) über 50 Prozent der deutschen Schriftsprache ausmachen.[1] Eine solche Liste ist vor allem für die Linguistik, Kryptoanalyse und Textkompression interessant. Es sei darauf hingewiesen, dass hier die Häufigkeit von Wörtern (grammatisches Wort: Wortform) und nicht von Worten (semantisches Wort: Wortparadigma oder Lemma) ermittelt wurde und ein Rückschluss auf die Größe des Wortschatzes daher nur begrenzt möglich ist. Eine die Verteilung von Worthäufigkeiten beschreibende Gleichung hatte 1928 E. V. Condon[2] aufgestellt.

Inhaltsverzeichnis 1 Die 207 häufigsten Wortformen im Deutschen (1897, Häufigkeitswörterbuch von F. W. Kaeding) 2 Die hundert häufigsten Wörter im Deutschen 3 Weitere Listen 4 Die häufigsten Substantive, Verben, Adjektive, Pronomen und Zahlen 5 Literatur 6 Siehe auch 7 Weblinks 8 Nachweise Die 207 häufigsten Wortformen im Deutschen (1897, Häufigkeitswörterbuch von F. W. Kaeding)[Bearbeiten | Quelltext bearbeiten] 30 Formen stellen 31,8 % der Wörter die, der, und, in, zu, den, das, nicht, von, sie, ist, des, sich, mit, dem, dass, er, es, ein, ich, auf, so, eine, auch, als, an, nach, wie, im, für

Diese Formen (mit Ausnahme der Form eine) sind wie nach dem Zipf’schen Gesetz zu erwarten einsilbig und höchstens fünf Buchstaben lang. Als Wortklassen sind vorwiegend Partikeln, insbesondere Konjunktionen und Präpositionen, sowie Personalpronomen und Artikel vertreten, beispielsweise alle einsilbigen Formen des bestimmten Artikels. Als einziges Verb taucht sein in der 3. Person Singular Präsens Indikativ (ist) auf. Die einzige Wortform in dieser Liste, die durch die Rechtschreibreform von 1996 beeinflusst wurde, ist dass.

Weitere 70 Formen stellen nochmals 15,3 % der Wörter man, aber, aus, durch, wenn, nur, war, noch, werden, bei, hat, wir, was, wird, sein, einen, welche, sind, oder, zur, um, haben, einer, mir, über, ihm, diese, einem, ihr, uns, da, zum, kann, doch, vor, dieser, mich, ihn, du, hatte, seine, mehr, am, denn, nun, unter, sehr, selbst, schon, hier, bis, habe, ihre, dann, ihnen, seiner, alle, wieder, meine, Zeit, gegen, vom, ganz, einzelnen, wo, muss, ohne, eines, können, sei

Das häufigste Substantiv ist nach dieser Zählung Zeit, allerdings wird bei der Zählung allgemein nicht zwischen Groß- und Kleinschreibung unterschieden, was das Ergebnis verfälschen kann. Als weiterer Verbalstamm zeigt sich haben in verschiedenen Formen.

Weitere 107 Formen stellen dann 7,25 % der Wörter ja, wurde, jetzt, immer, seinen, wohl, dieses, ihren, würde, diesen, sondern, weil, welcher, nichts, diesem, alles, waren, will, Herr, viel, mein, also, soll, worden, lassen, dies, machen, ihrer, weiter, Leben, recht, etwas, keine, seinem, ob, dir, allen, großen, Jahre, Weise, müssen, welches, wäre, erst, einmal, Mann, hätte, zwei, dich, allein, Herren, während, Paragraph, anders, Liebe, kein, damit, gar, Hand, Herrn, euch, sollte, konnte, ersten, deren, zwischen, wollen, denen, dessen, sagen, bin, Menschen, gut, darauf, wurden, weiß, gewesen, Seite, bald, weit, große, solche, hatten, eben, andern, beiden, macht, sehen, ganze, anderen, lange, wer, ihrem, zwar, gemacht, dort, kommen, Welt, heute, Frau, werde, derselben, ganzen, deutschen, lässt, vielleicht, meiner

Als erstes Vollverb erscheint sagen in der Liste, während wissen nicht vom Farbnamen in weiß getrennt gezählt ist. Die Okkurrenz von Paragraph deutet auf ein Textkorpus hin, das zu einem signifikanten Teil aus juristischen Texten besteht.

Die hundert häufigsten Wörter im Deutschen[Bearbeiten | Quelltext bearbeiten]

Diese Liste der Universität Leipzig (2001, Uni Leipzig, Deutschland-Korpus[3]) stammt aus dem Jahr 2001 und enthält deshalb und auch weil das Korpus aus Deutschland ist, noch das Wort Mark, das zudem weiterbestehende Bedeutungen hat.[4] Die gesprochene Sprache ist nicht berücksichtigt. Manche Wortformen wie Artikel tauchen doppelt auf, da die Großschreibung (am Satzanfang) berücksichtigt wird.

Platz 1–10 Platz Wort 1 der 2 die 3 und 4 in 5 den 6 von 7 zu 8 das 9 mit 10 sich Platz 11–20 Platz Wort 11 des 12 auf 13 für 14 ist 15 im 16 dem 17 nicht 18 ein 19 Die 20 eine Platz 21–30 Platz Wort 21 als 22 auch 23 es 24 an 25 werden 26 aus 27 er 28 hat 29 dass 30 sie Platz 31–40 Platz Wort 31 nach 32 wird 33 bei 34 einer 35 Der 36 um 37 am 38 sind 39 noch 40 wie Platz 41–50 Platz Wort 41 einem 42 über 43 einen 44 Das 45 so 46 Sie 47 zum 48 war 49 haben 50 nur Platz 51–60 Platz Wort 51 oder 52 aber 53 vor 54 zur 55 bis 56 mehr 57 durch 58 man 59 sein 60 wurde Platz 61–70 Platz Wort 61 sei 62 In 63 Prozent 64 hatte 65 kann 66 gegen 67 vom 68 können 69 schon 70 wenn Platz 71–80 Platz Wort 71 habe 72 seine 73 Mark 74 ihre 75 dann 76 unter 77 wir 78 soll 79 ich 80 eines Platz 81–90 Platz Wort 81 Es 82 Jahr 83 zwei 84 Jahren 85 diese 86 dieser 87 wieder 88 keine 89 Uhr 90 seiner Platz 91–100 Platz Wort 91 worden 92 Und 93 will 94 zwischen 95 Im 96 immer 97 Millionen 98 Ein 99 was 100 sagte Weitere Listen[Bearbeiten | Quelltext bearbeiten]

Im Duden-Korpus ist das häufigste Substantiv „Jahr“. Es folgen „Euro“, „Uhr“, „Prozent“ und „Deutschland“. Das Häufigkeitswörterbuch von Randall Jones und Erwin Tschirner 2015 wiederum umfasst gesprochenes und geschriebenes Deutsch. Gesprochenes basierend unter anderem auf in Deutschland erschienenen Fernsehsendungen. Auf Grund der Wahl der Korpora zeigt sich auch, dass derartige Häufigkeitslisten eher deutschlandlastig sind, in Österreich oder in der Schweiz würde das teils anders ausfallen („Mark“/„Euro“, „Paragraph“, „Deutschland“ usw.).

Für das Schweizer Hochdeutsch ist keine eigene Statistik bekannt.[5]

Die häufigsten Substantive, Verben, Adjektive, Pronomen und Zahlen[Bearbeiten | Quelltext bearbeiten]

Bei den Substantiven, Verben und Adjektiven werden nur die jeweiligen Grundformen angegeben. Es wurde festgestellt, welches Wort häufig vorkam, und dessen Grundwort in der Liste vermerkt. Bei den Pronomen wurden die groß geschriebenen Höflichkeitsformen nicht berücksichtigt. Bei den Zahlwörtern konnten die Formen der Zahl eins nicht von denen des indefiniten Artikels unterschieden werden.

Literatur[Bearbeiten | Quelltext bearbeiten] Werner König: dtv-Atlas zur deutschen Sprache (= dtv. Band 3025). 10., überarbeitete Auflage. Deutscher Taschenbuch-Verlag, München 1994, ISBN 3-423-03025-9, Worthäufigkeit, S. 114–115 (256 S.).  Friedrich Wilhelm Kaeding (Hrsg.): Häufigkeitswörterbuch der deutschen Sprache. Festgestellt durch einen Arbeitsausschuß der deutschen Stenographie-Systeme. (= Grundlagenstudien aus Kybernetik und Geisteswissenschaft. Band 4). Schnelle, Quickborn bei Hamburg 1963, S. 648–671 (Faksimile-Druck der Originalausgabe, Selbstverlag des Herausgebers, Steglitz bei Berlin 1897. 55 Seiten; Beiheft zu Band 4).  1. Teil: Wort- und Silbenzählungen (auszugsweise Reproduktion). 2. Teil: Buchstabenzählungen (Auszug aus dem Nachtrag). Helmut Meier: Deutsche Sprachstatistik. Mit einem Geleitwort von Lutz Mackensen. Georg Olms, Hildesheim 1967.  Band 1: Bausteine zu einer vergleichenden Sprachstatistik. 2., erweiterte und verbesserte Auflage, XIII, 406 S. Band 2: Relative Häufigkeitswerte zu den 512 häufigsten deutschen Wortformen, 150 S. Helmut Meier: Deutsche Sprachstatistik. 2. erweiterte Auflage. 2 Bände in 1 Band. Georg Olms, Hildesheim 1978 (422 und 150 Seiten).  Arno Ruoff (Hrsg.): Häufigkeitswörterbuch gesprochener Sprache. Gesondert nach Wortarten alphabetisch, rückläufig-alphabetisch und nach Häufigkeit geordnet. Unter Mitarbeit von Harald Fuchs (= Idiomatica. Band 8). 2. unveränderte Auflage. Niemeyer, Tübingen 1990, ISBN 3-484-24008-3 (517 S.).  Günther Thomé, Dorothea Thomé: Häufige Wörter. Basiskonzept Rechtschreiben. Was ist einfach? Was ist schwierig? 3., erweiterte Aufl. (kompl. Ökoproduktion). Oldenburg: isb-Fachverlag 2021 (ISBN 978-3-942122-25-2, 68 Farbseiten, 6,80 €, Leseprobe unter: www.isb-oldenburg.de). Siehe auch[Bearbeiten | Quelltext bearbeiten] Häufigkeitsklasse Buchstabenhäufigkeit Lauthäufigkeit Phonemhäufigkeit Sichtwort Textdeckung Weblinks[Bearbeiten | Quelltext bearbeiten] Die 10 (100, 1000, 10000) häufigsten Wörter der deutschen, englischen, niederländischen und französischen Sprache (Stand: 2001) (Memento vom 17. Dezember 2009 im Internet Archive) Korpusbasierte Grund-/Wortformenlisten des Instituts für Deutsche Sprache Die häufigsten Wörter in deutschsprachigen Texten aus dem Duden-Korpus Deutsche Wortliste mit über 1,9 Millionen Wörtern als Text-Datei Top 500 German Words (from Tschirner/Jones' Frequency Dictionary of German) Nachweise[Bearbeiten | Quelltext bearbeiten] ↑ Anmerkung: Kaedings Häufigkeitswörterbuch wurde nach jahrelangen Zählungen im Jahr 1897 veröffentlicht. ↑ George A. Miller: Wörter. Streifzüge durch die Psycholinguistik. Herausgegeben und aus dem Amerikanischen übersetzt von Joachim Grabowski und Christiane Fellbaum. Spektrum der Wissenschaft, Heidelberg 1993; Lizenzausgabe: Zweitausendeins, Frankfurt am Main 1995; 2. Auflage ebenda 1996, ISBN 3-86150-115-5, S. 303. ↑ Vgl. Wortschatz-Portal der Universität Leipzig. ↑ http://pcai056.informatik.uni-leipzig.de/downloads/etc/legacy/Papers/top1000de.txt ↑ Welches ist das häufigste Substantiv im Deutschen? In: Tages-Anzeiger. ISSN 1422-9994 (tagesanzeiger.ch [abgerufen am 11. November 2020]). 


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3